智能论文笔记

Dataset for Identification of Homophobia and Transophobia in Multilingual YouTube Comments

Bharathi Raja Chakravarthi , Ruba Priyadharshini , Rahul Ponnusamy , Prasanna Kumar Kumaresan , Kayalvizhi Sampath , Durairaj Thenmozhi , Sathiyaraj Thangasamy , Rajendran Nallathambi , John Phillip McCrae

分类：自然语言处理

2021-09-01

社交媒体平台上的滥用内容的增长增加对在线用户的负面影响。对女同性恋，同性恋者，跨性别或双性恋者的恐惧，不喜欢，不适或不疑虑被定义为同性恋/转铁症。同性恋/翻译语音是一种令人反感的语言，可以总结为针对LGBT +人的仇恨语音，近年来越来越受到兴趣。在线同性恋恐惧症/ Transphobobia是一个严重的社会问题，可以使网上平台与LGBT +人有毒和不受欢迎，同时还试图消除平等，多样性和包容性。我们为在线同性恋和转鸟以及专家标记的数据集提供了新的分类分类，这将允许自动识别出具有同种异体/传递内容的数据集。我们受过教育的注释器并以综合的注释规则向他们提供，因为这是一个敏感的问题，我们以前发现未受训练的众包注释者因文化和其他偏见而诊断倡导性的群体。数据集包含15,141个注释的多语言评论。本文介绍了构建数据集，数据的定性分析和注册间协议的过程。此外，我们为数据集创建基线模型。据我们所知，我们的数据集是第一个已创建的数据集。警告：本文含有明确的同性恋，转基因症，刻板印象的明确陈述，这可能对某些读者令人痛苦。

translated by 谷歌翻译

Reinforcement Learning for Predicting Traffic Accidents

Injoon Cho , Praveen Kumar Rajendran , Taeyoung Kim , Dongsoo Har

分类：人工智能 | 机器学习

2022-12-09

As the demand for autonomous driving increases, it is paramount to ensure safety. Early accident prediction using deep learning methods for driving safety has recently gained much attention. In this task, early accident prediction and a point prediction of where the drivers should look are determined, with the dashcam video as input. We propose to exploit the double actors and regularized critics (DARC) method, for the first time, on this accident forecasting platform. We derive inspiration from DARC since it is currently a state-of-the-art reinforcement learning (RL) model on continuous action space suitable for accident anticipation. Results show that by utilizing DARC, we can make predictions 5\% earlier on average while improving in multiple metrics of precision compared to existing methods. The results imply that using our RL-based problem formulation could significantly increase the safety of autonomous driving.

translated by 谷歌翻译

Concentration of polynomial random matrices via Efron-Stein inequalities

Goutham Rajendran , Madhur Tulsiani

分类：机器学习

2022-09-06

分析大型随机矩阵的浓度是多种领域的常见任务。给定独立的随机变量，许多工具可用于分析随机矩阵，其条目在变量中是线性的，例如基质 - 伯恩斯坦不平等。但是，在许多应用中，我们需要分析其条目是变量中多项式的随机矩阵。这些自然出现在光谱算法的分析中，例如霍普金斯等人。 [Stoc 2016]，Moitra-Wein [Stoc 2019]；并根据正方形层次结构的总和（例如Barak等。 [FOCS 2016]，Jones等。 [焦点2021]。在这项工作中，我们基于Paulin-Mackey-Tropp（概率Annals of Poylibity of Poyliby of 2016]，我们提出了一个通用框架来获得此类界限。 Efron-Stein不等式通过另一个简单（但仍然是随机）矩阵的范围来界定随机矩阵的规范，我们将其视为通过“区分”起始矩阵而引起的。通过递归区分，我们的框架减少了分析更简单的矩阵的主要任务。对于Rademacher变量，这些简单的矩阵实际上是确定性的，因此，分析它们要容易得多。对于一般的非拉多巴纳变量，任务减少到标量浓度，这要容易得多。此外，在多项式矩阵的设置中，我们的结果推广了Paulin-Mackey-Tropp的工作。使用我们的基本框架，我们在文献中恢复了简单的“张量网络”和“密集图矩阵”的已知界限。使用我们的一般框架，我们得出了“稀疏图矩阵”的边界，琼斯等人最近才获得。 [焦点2021]使用痕量功率方法的非平地应用，并且是其工作中的核心组成部分。我们希望我们的框架对涉及非线性随机矩阵浓度现象的其他应用有帮助。

translated by 谷歌翻译

Reinforcement Learning for Hardware Security: Opportunities, Developments, and Challenges

Satwik Patnaik , Vasudev Gohil , Hao Guo , Jeyavijayan , Rajendran

分类：人工智能 | 机器学习

2022-08-29

强化学习（RL）是一种机器学习范式，自主代理人通过与基础环境进行互动来学会做出最佳决策顺序。 RL引导的工作流在解开电子设计自动化问题中所证明的诺言鼓励硬件安全研究人员利用自动RL代理来解决特定领域的问题。从硬件安全性的角度来看，这种自主代理人可以在未知的对抗环境中产生最佳动作。另一方面，综合电路供应链的持续全球化迫使芯片制造成为离岸，不信任的实体，从而增加了对硬件安全性的担忧。此外，未知的对抗环境和增加的设计复杂性使后卫在检测攻击者（又称硬件木马）进行的微妙修改方面具有挑战性。在此简介中，我们概述了RL代理在检测硬件Trojans时的开发，这是最具挑战性的硬件安全问题之一。此外，我们概述了潜在的机会，并提出了应用RL解决硬件安全问题的挑战。

translated by 谷歌翻译

ATTRITION: Attacking Static Hardware Trojan Detection Techniques Using Reinforcement Learning

Vasudev Gohil , Hao Guo , Satwik Patnaik , Jeyavijayan , Rajendran

分类：人工智能 | 机器学习

2022-08-26

在综合电路制造过程中插入的隐形硬件木马（HTS）可以绕过关键基础架构的安全性。尽管研究人员提出了许多检测HTS的技术，但存在一些局限性，包括：（i）成功率低，（ii）高算法复杂性，以及（iii）大量的测试模式。此外，先前检测技术最相关的缺点源于不正确的评估方法，即，他们假设对手会随机插入HTS。这种不适当的对抗性假设使检测技术能够声称高HT检测准确性，从而导致“错误的安全感”。不幸的是，据我们所知，尽管关于检测在制造过程中插入的HTS的研究多了十年，但仍未进行对HT检测技术进行系统评估的协调努力。在本文中，我们扮演着现实的对手的角色，并通过使用加固学习（RL）开发自动化，可扩展和实用的攻击框架，质疑HT检测技术的功效。损耗逃避了两个HT检测类别的八种检测技术，展示了其不可知论行为。与随机插入的HTS相比，消耗量达到$ 47 \ times $ $ $ 47 \ times $ and $ 211 \ times $的平均攻击成功率。我们通过评估从广泛使用的学术套房到较大的设计（例如开源MIPS和MOR1KX处理器）到AES和AE AE和GPS模块等较大的设计，从而证明了损耗的逃避能力。此外，我们通过两个案例研究（特权升级和杀死开关）对MOR1KX处理器展示了损耗生成的HTS的影响。我们设想我们的工作以及发布的HT基准和模型，促进了更好的HT检测技术的发展。

translated by 谷歌翻译

HTML版本

DETERRENT: Detecting Trojans using Reinforcement Learning

Vasudev Gohil , Satwik Patnaik , Hao Guo , Dileep Kalathil , Jeyavijayan , Rajendran

分类：机器学习 | 人工智能

2022-08-26

在集成电路中插入硬件木马（HTS）是一个有害威胁。由于在罕见触发条件下激活HTS，因此使用随机逻辑模拟检测它们是不可行的。在这项工作中，我们设计了一个加固学习（RL）代理，该学习代理绕过指数搜索空间并返回最小的模式集，最有可能检测到HTS。各种基准测试的实验结果证明了我们的RL代理的功效和可扩展性，与国家相比，在维持或改善覆盖范围（$ 95.75 \％$）的同时，所需的测试模式数量显着降低（$ 169 \ times $）（$ 169 \ times $）（$ 169 \ times $）（$ 169 \ times $）（$ 95.75 \％$）。 - 艺术技术。

translated by 谷歌翻译

Analyzing Robustness of End-to-End Neural Models for Automatic Speech Recognition

Goutham Rajendran , Wei Zou

分类：自然语言处理 | 机器学习

2022-08-17

我们研究了预训练的神经模型的鲁棒性特性，以自动语音识别。机器学习中的现实生活数据通常非常嘈杂，几乎永远不会干净，这可以归因于各种因素，具体取决于域，例如异常值，随机噪声和对抗性噪声。因此，我们为各种任务开发的模型应该对这种嘈杂的数据具有强大的稳健性，这导致了强大的机器学习的蓬勃发展。我们认为在自动语音识别的情况下考虑了这个重要问题。随着预训练模型的日益普及，分析和理解此类模型对噪声的鲁棒性是一个重要问题。在这项工作中，我们对LibrisPeech和Timit数据集进行了预训练的神经模型Wav2Vec2，Hubert和Distilhubert的鲁棒性分析。我们使用不同种类的尖锐机制，并测量由推理时间和标准单词错误率指标量化的模型性能。当在层之间注入噪声时，我们还对WAV2VEC2模型进行了深入的层分析，从而使我们能够在高级别上预测每个层学习的内容。最后，对于此模型，我们可视化整个层中错误的传播，并比较它在清洁数据与嘈杂数据上的行为。我们的实验构成了Pasad等人的预测。 [2021]，还为未来的工作提出了有趣的方向。

translated by 谷歌翻译

Peduncle Gripping and Cutting Force for Strawberry Harvesting Robotic End-effector Design

Vishnu Rajendran S , Soran Parsa , Simon Parsons , Amir Ghalamzan Esfahani

分类：机器人

2022-07-25

在最近的过去，草莓的机器人收获引起了很多兴趣。尽管有很多创新，但它们尚未达到与人类采摘专家相当的水平。末端效应单元在定义这种机器人收割系统的效率方面起着重要作用。即使有关于草莓收集的各种最终效应子的报道，但是在某些情况下，研究人员可以依靠某些参数来开发新的最终效应子。这些参数包括可以在花梗上应用的抓地力极限，以有效地抓握，切割草莓花梗所需的力等。这些估计将对目标的最终效应器的设计周期有所帮助，以握住和切割在收获动作期间，草莓花梗。本文通过实验研究了这些参数的估计和分析。据估计，花梗的握力可以限制为10N。这使最终效应器能够抓住高达50克的草莓，而操纵加速度为50 m/s $^2 $，而不会挤压花梗。关于花梗切割力的研究表明，15 n的力足以在30度方向上使用楔形角度为16.6度的刀片切出草莓花梗。

translated by 谷歌翻译

Identifiability of deep generative models under mixture priors without auxiliary information

Bohdan Kivva , Goutham Rajendran , Pradeep Ravikumar , Bryon Aragam

分类：机器学习 | 人工智能 | (统计)机器学习

2022-06-20

我们证明了（a）具有通用近似功能的广泛的深层变量模型的可识别性，并且（b）是通常在实践中使用的变异自动编码器的解码器。与现有工作不同，我们的分析不需要弱监督，辅助信息或潜在空间中的条件。最近，研究了此类模型的可识别性。在这些作品中，主要的假设是，还可以观察到辅助变量$ u $（也称为侧面信息）。同时，几项作品从经验上观察到，这在实践中似乎并不是必需的。在这项工作中，我们通过证明具有通用近似功能的广泛生成（即无监督的）模型来解释这种行为，无需侧面信息$ u $：我们证明了整个生成模型的可识别性$ u $，仅观察数据$ x $。我们考虑的模型与实践中使用的自动编码器体系结构紧密连接，该体系结构利用了潜在空间中的混合先验和编码器中的Relu/Leaky-Relu激活。我们的主要结果是可识别性层次结构，该层次结构显着概括了先前的工作，并揭示了不同的假设如何导致可识别性的“优势”不同。例如，我们最薄弱的结果确定了（无监督的）可识别性，直到仿射转换已经改善了现有工作。众所周知，这些模型具有通用近似功能，而且它们已被广泛用于实践中来学习数据表示。

translated by 谷歌翻译

Towards Evaluating Adaptivity of Model-Based Reinforcement Learning Methods

Yi Wan , Ali Rahimi-Kalahroudi , Janarthanan Rajendran , Ida Momennejad , Sarath Chandar , Harm van Seijen

分类：机器学习 | 人工智能

2022-04-25

近年来，已经引入了越来越多的基于模型的强化学习（RL）方法。鉴于其许多潜在的好处，例如更高的样本效率和快速适应环境变化的潜力，对基于深层模型的RL的兴趣并不奇怪。但是，我们证明，使用最近引入的本地变化适应（LOCA）设置的改进版本，众所周知的基于模型的方法（例如Planet和Dreamerv2）在适应本地环境变化的能力方面表现不佳。结合先前的工作，对其他基于模型的方法Muzero进行了类似的观察，似乎出现了一种趋势，这表明当前基于深层模型的方法具有严重的局限性。我们通过识别损害适应性行为并将其与经常在基于DEEP模型的RL中经常使用的基础技术联系起来的元素，深入研究这种绩效不佳的原因。在线性函数近似的情况下，我们通过证明了线性DyNA的修改版本实现有效适应局部变化，从而验证了这些见解。此外，我们通过实验非线性版本的DYNA来提供详细的见解，以了解构建基于自适应非线性模型方法的挑战。

translated by 谷歌翻译